Escola de Métodos em Ciência Política
Cuidado com a utilização de etiquetas (nomes de objetos) com o mesmo nome de funções, pode gerar confusão no script
Em basicamente tudo que iremos fazer no R, a classe da informação importa Em termos elementares, ou ao nível dos valores, existem três grandes classes:
- Numeric (númerico);
- Logical (lógico);
- Character ou factor (caracteres);
Para obter a informação sobre a classe, iremos aprender nossa primeira função no R: class()
numeric é a classe composta por valores númericoslogical é a classe composta por TRUE, FALSE e NANão é preciso escrever sempre TRUE e FALSE, podemos resumir para T e F, respectivamente
Por trás dos valores T e F, há valores númericos correspondente a 1 e 0
character é a classe composta por nomes
Importante característica é que os nomes devem estar dentro de aspas, caso contrário, o R não reconhecerá como caracter
%in% na Seleção de elementos[1] TRUE
[1] FALSE
[1] FALSE
Um data.frame é o mesmo que uma tabela do SQL ou uma planilha Excel
seus dados provavelmente serão importados para um objeto data.frame
data.frame’s são listas especiais em que todos os elementos possuem o mesmo comprimento.
Cada elemento dessa lista pode ser pensado como uma coluna da tabela - ou como uma variável. Uso do ‘$’
Seu comprimento representa o número de linhas - ou seja, de observações
Funções úteis:
head() # Mostra as primeiras 6 linhas.
tail() # Mostra as últimas 6 linhas.
dim() # Número de linhas e de colunas.
names() # Os nomes das colunas (variáveis).
str() # Estrutura do data.frame. Mostra, entre outras coisas, as >classes de cada coluna.
cbind() # Acopla duas tabelas lado a lado.
rbind() # Empilha duas tabelas.O R possui diversas funções já instaladas dentro da sua programação
Exemplos são sum(), length(), class(), c()
Outras, porém, devem ser instaladas para que possam ser utilizadas pelos usuários
A forma como instalamos novas funções, não definidas anteriormente no software, é através de pacotes
Pacotes concentram diversas funções para diversas demandas
Importação de dados;
Organização de banco de dados;
Análises estatísticas específicas;
Gráficos diferenciados;
setwd(), que define o diretório da sua seção no RAntigamento, em caso de Windows, era necessário inverter as barras ou duplicar.
|
| | 0%
|
|=== | 4%
|
|===== | 7%
|
|======= | 10%
|
|========= | 13%
|
|================ | 22%
|
|================== | 26%
|
|====================== | 32%
|
|============================= | 41%
|
|===================================== | 52%
|
|======================================= | 56%
|
|============================================= | 64%
|
|=============================================== | 68%
|
|=========================================================== | 85%
|
|================================================================ | 92%
|
|=================================================================== | 96%
|
|======================================================================| 100%
- Provavelmente, demorará alguns segundos, até minutos, para a importação
- Além disso, essa forma **demanda acesso à internet**
[1] "DT_GERACAO" "HH_GERACAO"
[3] "ANO_ELEICAO" "CD_TIPO_ELEICAO"
[5] "NM_TIPO_ELEICAO" "NR_TURNO"
[7] "CD_ELEICAO" "DS_ELEICAO"
[9] "DT_ELEICAO" "SG_UF"
[11] "SG_UE" "NM_UE"
[13] "CD_CARGO" "DS_CARGO"
[15] "TP_AGREMIACAO" "NR_PARTIDO"
[17] "SG_PARTIDO" "NM_PARTIDO"
[19] "NR_FEDERACAO" "NM_FEDERACAO"
[21] "SG_FEDERACAO" "DS_COMPOSICAO_FEDERACAO"
[23] "SQ_COLIGACAO" "NM_COLIGACAO"
[25] "DS_COMPOSICAO_COLIGACAO" "CD_SITUACAO_LEGENDA"
[27] "DS_SITUACAO" "NM_TIPO_DESTINACAO_VOTOS"
str()tibble [251 × 28] (S3: tbl_df/tbl/data.frame)
$ DT_GERACAO : chr [1:251] "13/11/2024" "13/11/2024" "13/11/2024" "13/11/2024" ...
$ HH_GERACAO : 'hms' num [1:251] 10:54:54 10:54:54 10:54:54 10:54:54 ...
..- attr(*, "units")= chr "secs"
$ ANO_ELEICAO : num [1:251] 2018 2018 2018 2018 2018 ...
$ CD_TIPO_ELEICAO : num [1:251] 2 2 2 2 2 2 2 2 2 2 ...
$ NM_TIPO_ELEICAO : chr [1:251] "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" ...
$ NR_TURNO : num [1:251] 1 1 1 1 1 1 1 1 1 1 ...
$ CD_ELEICAO : num [1:251] 297 297 297 297 297 297 297 297 297 297 ...
$ DS_ELEICAO : chr [1:251] "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" ...
$ DT_ELEICAO : chr [1:251] "07/10/2018" "07/10/2018" "07/10/2018" "07/10/2018" ...
$ SG_UF : chr [1:251] "DF" "DF" "DF" "DF" ...
$ SG_UE : chr [1:251] "DF" "DF" "DF" "DF" ...
$ NM_UE : chr [1:251] "DISTRITO FEDERAL" "DISTRITO FEDERAL" "DISTRITO FEDERAL" "DISTRITO FEDERAL" ...
$ CD_CARGO : num [1:251] 8 9 3 9 4 8 8 5 3 8 ...
$ DS_CARGO : chr [1:251] "DEPUTADO DISTRITAL" "1º SUPLENTE" "GOVERNADOR" "1º SUPLENTE" ...
$ TP_AGREMIACAO : chr [1:251] "COLIGAÇÃO" "COLIGAÇÃO" "COLIGAÇÃO" "PARTIDO ISOLADO" ...
$ NR_PARTIDO : num [1:251] 50 18 27 30 44 23 16 16 90 77 ...
$ SG_PARTIDO : chr [1:251] "PSOL" "REDE" "DC" "NOVO" ...
$ NM_PARTIDO : chr [1:251] "PARTIDO SOCIALISMO E LIBERDADE" "REDE SUSTENTABILIDADE" "DEMOCRACIA CRISTÃ" "PARTIDO NOVO" ...
$ NR_FEDERACAO : num [1:251] -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
$ NM_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ SG_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ DS_COMPOSICAO_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ SQ_COLIGACAO : num [1:251] 7e+10 7e+10 7e+10 7e+10 7e+10 ...
$ NM_COLIGACAO : chr [1:251] "ELAS POR NÓS: SEM MEDO DE MUDAR O DF" "Brasília de Mãos Limpas" "CORAGEM E RESPEITO PELO POVO" "#NULO#" ...
$ DS_COMPOSICAO_COLIGACAO : chr [1:251] "PSOL / PCB" "PSB / PV / PC do B / PDT / REDE" "PR / PSDB / DEM / DC" "NOVO" ...
$ CD_SITUACAO_LEGENDA : chr [1:251] "D" "D" "D" "D" ...
$ DS_SITUACAO : chr [1:251] "DEFERIDO" "DEFERIDO" "DEFERIDO" "DEFERIDO" ...
$ NM_TIPO_DESTINACAO_VOTOS: chr [1:251] "Válido (legenda)" "#NE" "#NE" "#NE" ...
- attr(*, ".internal.selfref")=<externalptr>
head()# A tibble: 2 × 28
DT_GERACAO HH_GERACAO ANO_ELEICAO CD_TIPO_ELEICAO NM_TIPO_ELEICAO NR_TURNO
<chr> <time> <dbl> <dbl> <chr> <dbl>
1 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
2 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
# ℹ 22 more variables: CD_ELEICAO <dbl>, DS_ELEICAO <chr>, DT_ELEICAO <chr>,
# SG_UF <chr>, SG_UE <chr>, NM_UE <chr>, CD_CARGO <dbl>, DS_CARGO <chr>,
# TP_AGREMIACAO <chr>, NR_PARTIDO <dbl>, SG_PARTIDO <chr>, NM_PARTIDO <chr>,
# NR_FEDERACAO <dbl>, NM_FEDERACAO <chr>, SG_FEDERACAO <chr>,
# DS_COMPOSICAO_FEDERACAO <chr>, SQ_COLIGACAO <dbl>, NM_COLIGACAO <chr>,
# DS_COMPOSICAO_COLIGACAO <chr>, CD_SITUACAO_LEGENDA <chr>,
# DS_SITUACAO <chr>, NM_TIPO_DESTINACAO_VOTOS <chr>
head()# A tibble: 2 × 28
DT_GERACAO HH_GERACAO ANO_ELEICAO CD_TIPO_ELEICAO NM_TIPO_ELEICAO NR_TURNO
<chr> <time> <dbl> <dbl> <chr> <dbl>
1 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
2 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
# ℹ 22 more variables: CD_ELEICAO <dbl>, DS_ELEICAO <chr>, DT_ELEICAO <chr>,
# SG_UF <chr>, SG_UE <chr>, NM_UE <chr>, CD_CARGO <dbl>, DS_CARGO <chr>,
# TP_AGREMIACAO <chr>, NR_PARTIDO <dbl>, SG_PARTIDO <chr>, NM_PARTIDO <chr>,
# NR_FEDERACAO <dbl>, NM_FEDERACAO <chr>, SG_FEDERACAO <chr>,
# DS_COMPOSICAO_FEDERACAO <chr>, SQ_COLIGACAO <dbl>, NM_COLIGACAO <chr>,
# DS_COMPOSICAO_COLIGACAO <chr>, CD_SITUACAO_LEGENDA <chr>,
# DS_SITUACAO <chr>, NM_TIPO_DESTINACAO_VOTOS <chr>
Lembrando que dataframes são listas de vetores
[1] "PSOL" "REDE" "DC" "NOVO"
[5] "PRP" "PPS" "PSTU" "PSTU"
[9] "PROS" "SOLIDARIEDADE" "PSB" "PR"
[13] "DC" "PSD" "DEM" "DC"
[17] "DC" "PODE" "PSB" "PC do B"
[21] "DEM" "PHS" "PSOL" "PPL"
[25] "PROS" "PMB" "PSD" "PRTB"
[29] "DEM" "PDT" "PSTU" "PV"
[33] "PHS" "PSD" "NOVO" "AVANTE"
[37] "PSOL" "PCO" "PT" "PSDB"
[41] "PP" "PSOL" "PATRIOTA" "PSC"
[45] "MDB" "PCB" "PPL" "NOVO"
[49] "PHS" "PV" "NOVO" "PV"
[53] "PT" "REDE" "PMN" "PP"
[57] "PCO" "PR" "REDE" "PRTB"
[61] "PTB" "PV" "MDB" "PTB"
[65] "PV" "PATRIOTA" "PSC" "PSOL"
[69] "PCB" "REDE" "PP" "PSC"
[73] "PTB" "MDB" "PSC" "PMN"
[77] "DEM" "PSTU" "PROS" "PRB"
[81] "PCO" "PP" "PROS" "PSB"
[85] "PRP" "PSTU" "PSC" "PTC"
[89] "PTB" "PODE" "PSDB" "PDT"
[93] "PT" "PP" "PRP" "PSD"
[97] "PSD" "PMN" "PSL" "PSOL"
[101] "PTC" "PSTU" "PCO" "PSL"
[105] "DC" "REDE" "PDT" "PPS"
[109] "PRTB" "PODE" "PRP" "PC do B"
[113] "PMN" "PSD" "PSD" "PDT"
[117] "PSDB" "PPL" "PCO" "PSL"
[121] "PP" "PTC" "PSB" "PMN"
[125] "PRB" "PHS" "PPS" "PPS"
[129] "PMN" "PROS" "PT" "PTC"
[133] "AVANTE" "PCB" "DEM" "SOLIDARIEDADE"
[137] "DEM" "NOVO" "PATRIOTA" "MDB"
[141] "PSL" "PTC" "PTC" "DEM"
[145] "PDT" "PATRIOTA" "PSB" "NOVO"
[149] "PODE" "PSB" "PR" "PRTB"
[153] "AVANTE" "PR" "PODE" "REDE"
[157] "PODE" "PMB" "NOVO" "PRP"
[161] "PDT" "PCB" "PPS" "PSL"
[165] "PCO" "AVANTE" "DC" "PR"
[169] "SOLIDARIEDADE" "PRP" "PSL" "PSDB"
[173] "PMB" "PRTB" "PPS" "PV"
[177] "SOLIDARIEDADE" "PMN" "PROS" "PSDB"
[181] "PT" "PHS" "PPL" "PPS"
[185] "PR" "PDT" "PSC" "PC do B"
[189] "PRB" "PHS" "AVANTE" "PV"
[193] "PR" "PT" "PT" "PATRIOTA"
[197] "PR" "PC do B" "PMB" "PSC"
[201] "PMB" "PRP" "PPL" "MDB"
[205] "PRB" "PDT" "PTB" "PSTU"
[209] "DC" "PSDB" "PR" "PRTB"
[213] "MDB" "PR" "AVANTE" "PSDB"
[217] "PRB" "PC do B" "PTB" "PC do B"
[221] "PCB" "PRTB" "PMB" "PSOL"
[225] "PATRIOTA" "PRB" "REDE" "PROS"
[229] "PTC" "PCB" "PATRIOTA" "PCO"
[233] "PMB" "AVANTE" "PRB" "PPL"
[237] "PSB" "PHS" "PTB" "MDB"
[241] "SOLIDARIEDADE" "PCB" "PV" "PP"
[245] "PR" "PODE" "PSL" "PC do B"
[249] "PPL" "SOLIDARIEDADE" "SOLIDARIEDADE"
CURSO DE R